基于 Pacbio 第 三 代 测 序 技术 的 厚 朴 基因 组 测序 分 析 


SEM, TER Efe. MEME. KEG SALE. ARE 
(成 都 中 医药 大 学 药学 院 西南 特色 中 药 资源 国家 重点 实验 室 ， 成 都 611137 ) 

摘要 厚 朴 为 著名 的 传统 药 用 植物 ， 归 于 木兰 科 、 木 兰 属 ， 于 我 国 广泛 种 植 ， 其 树 皮 、 根 皮 、 枝 
皮 、 叶 片 、 花 、 果 实 均 能 入 药 或 食用 。 为 获取 厚 朴 全 基因 组 序列 以 厚 朴 叶片 DNA 为 材料 ， 

该 文采 用 Pacbio Sequel 第 三 代 测序 技术 构建 厚 朴 全 基因 组 数据 库 , 并 利用 生物 信息 学 方法 对 获得 的 
核 背 酸 序列 进行 组 装 、 功能 注释 以 及 进化 分 析 研 究 。 结果 表明 : 原始 测序 数据 过 滤 后 获得 140.91 Gb 
三 代数 据 ，Read N50 约 为 13 784 bp， 经 过 组 装 得 到 厚 朴 基因 组 大 小 为 1.68 Gb, Contig N50 约 为 222 
069 bp， 单 拷贝 基因 完整 性 为 78.05 %。 组装 后 的 序列 通过 与 NR、KOG、KEGG 等 功能 数据 库 比 对 ， 
1498.40 % 的 基因 得 到 了 功能 注释 , 其 中 KOG 功 能 注释 结果 发 现 厚 村 的 蛋白 功 能 主要 集中 在 一 般 
功能 预测 、 翻 译 后 修饰 、 蛋 白质 转换 、 伴 倡 以 及 信号 转 导 机 制 ; GO 功能 分 类 表明 厚 朴 的 基因 集中 
在 细胞 组 分 及 生物 学 过 程 ; KEGG 分 析 发 现 厚 朴 参 与 代谢 通路 的 基因 占 主要 地 位 。 通 过 与 简 萄 、 拟 
南 芥 、 水 稻 、 杨 树 、 银 杏 、 无 油 樟 、 茶 树 及 牛 樟 基 因 组 的 比 对 分 析 ， 发 现 厚 朴 23 424 个 基因 中 有 20 
801 个 基因 可 以 分 类 到 12 129 个 家 族 , 其 中 有 515 个 基因 家 族 是 厚 朴 所 特有 的 , 而 厚 朴 与 牛 樟 〈 樟 科 ) 
亲缘 关系 较 近 ， 两 者 的 分 化 时 间 约 在 122.5 百 万 年 前 mya)。 该 研究 首次 利用 第 三 代 测 序 技术 对 厚 朴 
全 基因 组 解析 ， 有 利于 对 其 进一步 进行 深入 的 开发 与 利用 ， 也 为 研究 其 它 药 用 植物 全 基因 组 黄 定 
了 基础 。 
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Abstract: Magnolia officinalis is a famous traditional medicinal plant, belonging to the Magnoliaceae 
family and Magnolia genus and being widely cultivated in China. Its bark, root bark, branch bark, leaves, 
flowers and fruits could be used as medicine or food. However, the whose genome information is little 
known for this plant species. In order to obtain the whole genome sequence information of M. officinalis, 
the leaf DNA was used as the material, and the third-generation sequencing technology of Pacbio Sequel 
was used to establish its nucleotide sequence database. Then genome assembly, function annotation and 
evolution analysis were carried out by bioinformatic methods. The experimental results showed that 
140.91 Gb third-generation data were obtained after the original sequencing data, with the Read N50 
about 13 784 bp. The assembled M. officinalis genome size was 1.68 Gb, Contig N50 being about 222 
069 bp, and the integrity of single copy gene being 78.05 96. 98.4096 of the genes from the assembled 
sequence got gene annotation after being compared with functional databases such as NR, KOG and 
KEGG. The result of KOG gene annotation was that the protein function of M. officinalis concentrated in 
the general functional prediction only, posttranslational modification, protein turnover, chaperones signal 
transduction mechanisms. GO functional classification indicated that the genes of M. officinalis 
concentrated on cell components and biological processes. KEGG analysis found that the M. Officinalis 
genes mostly involved in metabolic pathways. By comparative genomics analysis, the genomes of Vitis 
vinifera, Arabidopsis thaliana, Oryza sativa, Poplar trichocarpa, Ginkgo biloba, Amborella trichopoda, 
Camellia sinensis and Cinnamomum kanehirae were aligned. It was found that 20 801 of 23 424 genes in 
M. officinalis could be classified into 12 129 families, 515 gene families being unique to M. officinalis. 
The genetic evolution tree constructed from the genomes of the selected reference species pointed that 
the M. officinalis (Magnoliaceae) was closely related to Cinnamomum kanehirae (Lauraceae), and the 
divergence time between the two species was about 122.5 mya. It is the first time to use the 
third-generation sequencing technology to analyze the whole genome of M. officinalis in the study. The 
study is conducive to its further development and utilization, and also provides the information for the 
study of the whole genome of other medicinal plants. 
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随 着 人 类 基因 组 计划 的 完成 ， 基 因 组 测序 技术 的 不 断 发 展 和 逐渐 成 熟 ， 尤 其 以 第 三 代 测 序 技 
术 发 展 为 单 分 子 实时 测序 ， 这 加 速 了 植物 全 基因 组 研究 的 进程 。 基 因 组 大 小 是 指 某 个 物种 单 倍 体 
基因 组 的 全 部 DNA 碱 基 对 数 ， 是 研究 物种 基因 组 学 的 基础 。 木 兰 科 在 植物 进化 及 分 类 学 中 的 地 位 
属于 比较 原始 的 科 ， 近 年 来 关于 木兰 属 物种 叶绿体 基因 组 测序 在 国内 外 研究 较 多 ， 如 李 西 文 ( 李 
西 文 等 ，2012; Li et al.，2013) 等 通过 454 FLX 第 二 代 高 通 量 测序 平台 建立 一 种 厚 朴 叶绿体 基因 组 
的 标准 测序 流程 用 于 区 分 厚 朴 及 近 缘 物种 , 并 利用 测序 平台 获得 了 木兰 属 物种 荷花 玉兰 (Magnolia 
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grandiflora) 的 叶绿体 全 基因 组 序列 ， 为 其 优良 品种 的 选 育 、 叶 绿 体 基 因 工 程 、 分 子 标记 的 开发 和 
系统 发 育 分 析 提 供 了 有 价值 的 信息 ; CUI (CUI et aL, 2019) 等 对 厚 朴 同属 物种 天 女 木 兰 CM. 
sieboldii) 进行 叶绿体 全 基因 组 测序 , 获得 了 111 个 独特 的 基因 , 包括 78 个 蛋白 编码 基因 、29 个 tRNA 
基因 和 4 个 rRNA 基因 。 
厚 机 (Magnolia officinalis) 为 木兰 科 木 兰 属 植物 ， 主 产 于 四 川 东 部 、 湖 北西 部 等 地 ， 野 生 厚 
朴 是 我 国 二 级 保护 植物 〈 薛 珍 珍 等 ，2019 )。 厚 朴树 皮 、 枝 皮 、 根 皮 、 芽 等 均 可 入 药 ， 在 临床 中 广 
泛 使 用 。 此 外 ， 厚 朴 花 大 美丽 ， 被 列 入 保健 食品 名 录 ， 其 种 子 可 榨 油 ， 有 明 目 益 气 之 功效 。 同 时 
厚 朴 作为 道 地 药材 ， 其 主要 活性 成 分 是 以 厚 朴 酚 及 和 厚 朴 酚 代表 的 酚 类 ， 研 究 表 明 这 两 种 活性 成 
分 具有 良好 抗菌 、 抗 炎 、 抗 肿瘤 和 抗 病毒 等 药理 作用 〈 王 立 青 等 ，2005) 。 
查 良 平 〈 查 良平 等 ，2015) 等 通过 转录 组 学 研究 了 厚 朴 丫 类 化 合 物 的 生物 合成 途径 ， 揭 示 其 中 的 
甲状 成 酸 (MVA) 途 径 相 关 基 因 调 控 划 类 次 级 代谢 产物 的 合成 机 制 ; 时 小 东 〈 时 小 东 等 ，2018) 等 
在 此 基础 上 深入 研究 厚 朴 次 级 代谢 产物 中 葵 丙 素 途 径 和 罩 类 合成 途径 ， 获 得 了 代谢 途径 中 相关 酶 
和 基因 的 信息 。 
厚 朴 在 自然 环境 下 生长 周期 长 ， 同 时 产量 也 较 低 ， 但 市 场 需求 量 大 ， 所 以 人 工 繁殖 培育 的 厚 
朴 较 多 ， 种 质 资源 丰富 〈 张 龙 辉 等 ，2013 )。 然 而 当前 关于 厚 朴 的 研究 对 其 遗传 信息 、 进 化 历程 及 
性 状 形成 等 相关 分 子 生物 学 基础 缺乏 认识 和 了 解 ， 导 致 厚 朴 的 厚 朴 酚 、 和 厚 朴 酚 等 核心 次 级 代谢 
产物 的 合成 调控 机 理 尚 有 诸多 不 清楚 ， 对 其 在 分 子 辅助 育种 ， 发 掘 相关 生长 发 育 、 抗 病 抗 逆 等 优 
T 良性 状 基因 等 方面 的 问题 也 不 能 有 效 解决 ， 造 成 厚 朴 资源 利用 度 低 ， 开 发 不 够 深入 。 因 此 ， 本 研 
e 究 基于 厚 朴 遗传 基因 组 信息 匮乏 ， 初 步 对 厚 朴 进行 全 基因 组 测序 研究 ， 获 得 的 基因 组 信息 将 会 进 
~ 一 步 丰富 了 厚 朴 遗传 进化 研究 资料 ， 为 接 下 来 探索 药 用 植物 优良 品种 选 育 、 有 效 成 分 的 生物 合成 
途径 与 调控 机 制 及 综合 开发 利用 等 黄 定 基础 。 


1 材料 与 方法 


1.4 厚 朴 样品 及 DNA 提取 

厚 朴 植株 选取 于 成 都 中 医药 大 学 药 用 植物 园 ， 采 摘 新 鲜 幼 嫩 无 病害 的 叶片 ， 蒸 馏 水 清洗 表 
后 ， 再 使 用 75 % 乙 醇 清 洗 3 次 ， 擦 干 ，-80 °C 冻 存 备用 。 

采用 CTAB 法 ( 沙 丽 萍 ，2018) 提取 厚 村 叶片 DNA， 步 又 如 下 : 样品 使 用 液 氮 研磨 后 分 装 
c AE BEP ODTEI BOE PIATA ede — PESE ERR (CTAB), 65 °C 水 浴 1 h, 10 800 r-min' 
e 离心 10 min， 取 上 清 @ 离 心 后 加 入 等 体积 握 仿 : RE (24:1)， 充 分 混 匀 后 ，4 *C、10 800 rmin 
离心 10 min,， 取 上 清 , 重 复 两 次 名 向 上 清 中 加 入 异 丙 醇和 乙酸 钠 溶 液 ， 离 心 ， 充 上 清 @@ 加 入 75 % 乙 
醇 ， 离 心 ， 弃 上 清 @ 晾 干 ， 加 入 TE 缓冲 液 溶解 ，4 °C 保存 备用 。 
1.2 文库 构建 及 测序 

首先 使 用 g-TUBE 剪 切 管 打 断 厚 朴 DNA 样品 ， 然 后 对 打 断 的 DNA 样品 (5 hg) 使 用 建 库 试 
f£: (SMRTbell Template Prep Kit) 进行 损伤 修复 、 末 端 修复 及 连接 接头 ， 对 连接 接头 产物 使 用 
BluePippin Size-Selection System 进行 目的 片段 角 选 ， 并 通过 AMpure PB 磁 珠 进行 纯化 回收 ;回收 
产物 使 用 损伤 修复 试剂 盒 CSMRTbell Damage Repair Kit) 进行 二 次 损伤 修复 ， 并 对 修复 产物 进行 
AMpure PB 磁 珠 纯化 回收 ; 最 终 文库 即 二 次 损伤 修复 产物 进行 浓度 (Qubit) 及 大 小 (Agilent 2100) 
的 文库 质量 检测 ， 即 得 到 测序 文库 。 采 用 第 三 代 测 序 平台 Pacbio Sequel 进行 单 分 子 测序 ， 原 始 数 
据 进 行 评估 、 过 滤 后 得 到 高 质量 的 数据 用 于 基因 组 组 装 与 质量 评估 。 
1.3 基因 组 组 装 及 评估 


对 PacBio 测 序 平 台 产生 的 原始 数据 进行 过 滤 低 质量 和 短片 段 后 , 利用 Canu (Koren et al., 2017) 
软件 对 过 滤 后 的 数据 进行 初步 组 装 ， 然 后 采用 LACHESIS(Belton et al.，2012) 软 件 对 初步 组 装 后 的 
序列 进行 群 组 的 划分 、 排 序 和 定向 。 将 每 个 Scaffold 按 照 等 长 50 Kb 打 断 ， 利 用 Hi-CChigh-throughput 
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chromosome conformation capture) 技 术 (Marbout & Koszul, 20150 重新 组 装 ， 将 无 法 还 原 为 最 初 
组 装 序列 的 位 置 列 为 候选 错误 区 域 ， 然 后 鉴定 此 区 域 中 低 Hi-C 履 盖 深 度 的 位 置 即 为 错误 点 ， 从 而 
完成 对 初步 组 装 基因 组 的 纠 错 , 以 提高 基因 组 组 装 质量 。 对 组 装 结果 利用 BUSCO v2.0(Simao et al., 
20150 软件 来 评 佑 组装 基因 组 的 完整 性 ， 与 Embryophyta_odb9 数 据 库 中 含有 的 植物 1 440 个 保守 的 
核心 基因 比 对 ， 并 绘制 互 作 热 图 来 评估 Hi-C 组 装 结果 。 (LACHESIS 软 件 使 用 具体 参数 为 : (1) 
CLUSTER MIN RE SITES=52; (2)CLUSTER MAX LINK DENSITY=2 ; (3)CLUSTER 
NONINFORMATIVE RATIO = 2; (4) ORDER MIN N RES IN TRUN-46; (5) ORDER MIN N RES IN 
SHREDS-42. ) 


1.4 序列 预测 


使 用 LTR FINDER v1.05 (Zhao & Wang, 2007) 、RepeatScout v1.0.5 (Price et al., 2005) 、 

PILER-DF v2.4 (Edgar & Myers, 2005) 软件 首先 基于 结构 预测 和 从 头 预测 CAD initio) 的 原理 构 
建 重复 序列 数据 库 ， 对 构建 好 的 重复 序列 库 通 过 PASTEClassifier (Wicker et al.，2007) 进行 分 类 ， 
然后 基于 重复 序列 数据 库 Repbase(https:Wwww.girinst.org/repbase/) 合 并 作为 最 终 的 厚 朴 基因 组 的 习 
复 序 列 数据 库 ， 再 通过 RepeatMasker v4.0.6 (Tarailo & Chen, 2009) 软件 基于 构建 好 的 数据 库 对 
厚 朴 进行 重复 序列 的 预测 。 
基于 从 头 预 测 〈42 initio) 和 同 源 物种 预测 (Homolog) 两 种 原理 对 厚 朴 基因 组 进行 基因 预测 ， 
并 对 预测 结果 进行 评估 。 使 用 Genscan (Burge & Karlin，1997) 、Augustus v2.4 CStanke & Waack， 
2003) . GlimmerHMM v3.0.4(Majoros et al., 2004)、GeneID v1.4(Blanco et al., 2007) , SNAP(version 
2006-07-28) (Blanco et al., 2007) 进行 从 头 预测 ;使 用 GeMoMa v1.3.1 Gens et al., 2016) 进行 
基于 同 源 物种 的 预测 ， 最 后 利用 EVM v1.1.1 整 合 上 述 方法 得 到 的 预测 结果 。 同 时 针对 非 编 码 RNA 
预测 ， 包 括 了 microRNA、rRNA 及 tRNA 等 已 知 功 能 的 RNA， 分 别 基于 Rfam (Griffithsjones et al., 

2005) 数据 库 和 miRBase CGriffithsjones et al., 2006) 数据 库 并 利用 Infenal 1.1 (Nawrocki & Eddy; 
2013) 进行 RNA 和 microRNA 预 测 ; 利用 tRNAscan-SE v1.3.1 (http://lowelab.ucsc.edu/tRNAscan-SE/) 

(Lowe & Eddy, 1997) 识别 tRNA。 


1.5 功能 基因 注释 
对 预测 得 到 的 基因 序列 与 NR (Non-Redundant Protein Database? (Aron et al., 2011) ~ KOG 

CEuKaryotic Orthologous Groups?) (Tatusov et al., 2001) ~ KEGG (Kyoto Encyclopedia of Genes and 
Genomes) (Minoru & Susumu, 2000) 、TrEMBL (Boeckmann et al., 2003) 等 功能 数据 库 做 BLAST 
v2.2.31 (Altschul et al., 1990) EX COE ELEC IRAE B] fLe-value«1e-5), fG-BIXEDLUIBEHSEE. SET NR 
数据 库 比 对 结果 ， 应 用 软件 Blast2GO (Conesa et al., 2005) 进行 GO (Dimmer et al., 2012) 数据 
库 的 功能 注释 。 
1.6 比较 基因 组 学 分 析 


利用 厚 朴 的 蛋白 序列 及 其 它 物种 [葡萄 (Vitis vinifera)、 拟 南 芥 (Arabidopsis thaliana)、 水 称 (Oryza 
sativa)、 杨 树 (Populus trichocarpa)、 和 银杏 (Ginkgo biloba)、 无 油 樟 (Ampborella trichopoda), ZW} 
(Camellia sinensis) 、 和 牛 樟 (Cinnamomum kanehirae)] 的 蛋白 序列 比 对 (NCBI 数据 Æ 
https://www.ncbi.nlm.nih.gov/〉， 基 于 序列 比 对 结果 ， 对 已 知 基因 的 序列 和 结构 进行 比较 ， 分 析 物 
种 间 的 进化 以 及 物种 特有 基因 的 分 类 。 
使 用 OrthoMCL(Li, 2003) 软 件 (参数 :Pep_length: 10, Stop. coden: 20, PercentMatchCutoff: 
50, EvalueExponentCutoff: -5, Mcl: 1.5 #1.2~4.0) 对 上 述 9 个 物种 的 和 蛋白 序列 进行 家 族 分 类 ， 寻 找 厚 
朴 基 因 组 特有 的 基因 家 族 。 利 用 OrthoMCL 聚 类 的 结果 提取 单 拷贝 蛋白 序列 ， 然 后 将 单 拷贝 蛋白 
序列 使 用 Muscle(http://www.ebi.ac.uk/Tools/msa/muscle/) 软 件 进 行 序列 比 对 ,使 用 PHYML(Stéphane 
etal., 2010) 软件 (参数; -gapRatio 0.5, -badRatio 0.25, -model HKY 85, -bootstrap 1000) 通 过 ML( 最 
大 似 然 法 ) 构 建 进化 树 , 研究 物种 间 的 进化 关系 。 利 用 Timetree(http://www.timetree.org/) 2t W C£ 47] 
种 之 间 的 化 石 时 间 ， 然 后 通过 mcmctree Chttp://abacus.gene.ucl.ac.uk/software/paml.html) 可 估算 出 
物种 间 的 分 化 时 间 。 采 用 MCScanX (Wang etal., 20120 软件 分 别 对 自身 (参数 : -s 10 ,-b 1， 其 他 


pad 
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参数 默认 ) 及 与 近 缘 物种 牛 檬 (Cinnamomum kanehirae) C838: -s 10 ,-b 2， 其 他 参数 默认 ) 基因 
组 做 共 线 性 分 析 ， 统 计 相应 的 共 线 性 基因 数目 和 共 线 性 区 块 〈Block) 数目 。 


2 结果 与 分 析 


2.1 基因 组 测序 
通过 三 代 测 序 平台 对 厚 朴 叶片 进行 全 基因 组 测序 ， 对 原始 数据 的 reads 质 量 值 进行 初步 过 滤 ， 
去 掉 低 质量 和 短片 段 的 reads， 统 计 得 到 140.91 Gb 三 代 原 始 数据 ，Read N50 为 13 784 bp， 最 长 reads 
的 长 度 为 128 492 bp， 平 均 长 度 为 8 654 bp， 测 序 质量 符合 后 续 组 装 要 求 。 
2.2 基因 组 组 装 及 评估 
借助 Canu 软 件 对 厚 朴 的 初步 组 装 结果 见 表 1, 初步 组 装 的 序列 经 过 Hi-C 纠 错 组 装 后 基因 组 大 小 
约 为 1.68 Gb, Contig N50 为 222 069 bp， 最 长 的 Contig 为 2 700 203 bp，GC 含 量 为 40.65 96. Hi-C£H 
装 后 其 中 共有 1.67 Gb 的 序列 长 度 的 基因 组 序列 被 定位 到 19 条 染色 体 上 ， 占 比 99.66 %， 而 对 应 的 序 
列 数目 为 11 470 条 ， 占 比 99.20 %。 在 定位 到 染色 体 上 的 序列 中 ， 能 够 确定 顺序 和 方向 的 的 序列 长 
度 为 1.53 Gb， 占 定位 染色 体 序列 总 长 度 的 91.21 %， 对 应 的 序列 数目 为 8 689 条 ， 占 定位 染色 体 序 
列 总 数目 的 75.75 %。 

组 装 后 的 基因 组 采用 BUSCO 软 件 评估 ， 在 组 装 的 基因 中 共 找 到 1 340 个 完整 的 BUSCO 基 因 ， 
其 中 单 拷贝 的 1 124 个 ，Fragmented BUSCO 61 个 基因 ， 有 93 个 基因 在 Embryophyta_odb9 数 据 库 中 
没有 找到 ，BUSCO 评 估 基 因 组 完整 度 为 93.05 %， 说明 组 装 结果 较 完 整 。 通 过 Hi-C 辅 助 组 装 热 图 分 
析 ( 图 1 ) ， 厚 朴 19 个 染色 体 分 组 可 以 明显 区 分 ， 且 每 一 分 组 对 角 线 的 交互 强度 信号 要 高 于 非 对 角 
线 位 置 ， 说 明 Hi-C 组 装 的 染色 体 结果 中 邻近 的 序列 间 《〈 对 角 线 位 置 ) 交互 强度 高 ， 而 非 邻近 的 序 
列 之 间 〔 非 对 角 线 位 置 ) 的 交互 信号 强度 弱 ， 证 明基 因 组 组 装 效果 较 好 。 


表 1 厚 机 基因 组 序列 组 装 结果 


Table 1 genome sequence assembly results 


DAMM f 重 登 群 N50 — HUÉBENOO — XHE EG 
组 装 方法 FARAH 重合 群 长 度 . 碱 基 含量 
的 长 度 的 长 度 群 的 长 度 
Assembly Contig Contig GC 
Contig Contig Contig 
method Number length (bp) content (%) 
N50 (bp) N90 (bp) max (bp) 
Canu 组 装 
Assembled by 13 347 1 710 407 060 180 351 56 620 3 512 806 40.68 
Canu 
Hi-C 组 装 
Assembled by 11 562 1 684 361 614 222 069 61 049 2 700 203 40.65 
Hi-C 


X2 BUSCO 评 估 结 果 
Table2 BUSCO assessment results 


A 


物种 完整 基因 数 单 拷贝 基因 数 多 拷贝 基因 数 ”不 完整 基因 数 ”未 预测 至 


Species Complete Complete and Complete and Fragmented 到 基因 数 
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BUSCOs single-copy duplicated BUSCOs Missing 
BUSCOs BUSCOs BUSCOs 

厚 朴 
1 340(93.05 96) 1 124(78.05 96) 176(12.22 96) 61(4.2 96) 93(6.4 96) 


Magnolia officinalis 


zoc 
8 8 
Eo 


log2(N links) 
75 
50 
25 


染色 体 
Chromosome 
c or 
8 8 


0.0 


i 
SS 
KS 


染色 体 
Chromosome 
LG0-LG18 代 表 Lachesis Group 0-18， 横 坐标 、 纵 坐标 均 代 表 每 个 bin 在 相应 染色 体 群 组 上 的 次 序 。 
LG0-LG18 represent Lachesis Group 0-18, and the abscissa and ordinate represent the order of each bin on the 


corresponding chromosome group. 


图 1 厚 朴 基因 组 Hi-C 组 装 染色 体 交 互 热 图 


Fig.l Hi-C assembly chromosome interaction heat map of Magnolia officinalis 


2.3 基因 预测 结果 

利用 RepeatMasker v4.0.6 软 件 进行 重复 序列 预测 得 到 包含 1.37 Gb 重 复 序列 的 厚 朴 基因 组 , 占 比 
81.60 %。 其 中 长 散在 重复 序列 (LINE) 得 到 重复 序列 数目 为 450 863 条 ， 占 比 8.47 %; 短 散 在 重 
复 序列 (SINE) 数 目 为 18 530 条 , 占 比 0.2%; 长 末端 重复 序列 (LTR ) 数 目 为 997 318 条 , 占 比 44.04 96; 
末端 反 向 重复 序列 (TIR) 数目 为 145 539 条 ， 占 比 4.5 %; 简单 重复 序列 CSSR) 数目 为 10 506 条 ， 
占 比 0.47 96. 

对 厚 朴 的 基因 预测 结果 显示 〈 表 3) 获得 了 23 424 个 蛋白 编码 基因 及 1 096 个 非 蛋 白 编 码 基因 ， 
包括 了 72 个 microRNA 基 因 ，575 个 tRNA 基因 和 449 个 rRNA 基 因 。 


RI 厚 村 基因 预测 结果 
Table 3 Statistics of Magnolia officinalis gene prediction results 


方法 软件 物种 基因 数目 


Method Software Species Gene number 


Genscan Magnolia officinalis 36 942 
Augustus Magnolia officinalis 43 814 
Ab initio GlimmerHMM Magnolia officinalis 42 639 
GeneID Magnolia officinalis 78 769 
SNAP Magnolia officinalis 23 024 
Arabidopsis thaliana 22 928 
Oryza sativa 25 212 
Homology-based GeMoMa 
Helianthus annuus 37 376 
Nelumbo nucifera 27 011 
Integration EVM Magnolia officinalis 23 424 
2.4 基因 功能 注释 与 分 析 
通过 KOG 功能 注释 (图 2)， 厚 朴 基因 组 的 13 845 个 基因 获得 注释 ， 占 预测 到 的 总 基因 数 的 


59.11 96. JA 


图 中 可 以 看 出 ， 厚 朴 的 蛋白 


(posttranslational modification, protein turnover, chaperones)(O) i 比 10 96; * 


功能 主要 集中 在 “翻译 后 修饰 、 蛋 


质 转换 、 伴 侣 ” 
言 号 转 导 机 制 ”(signal 


transduction mechanisms)(T) 占 比 9 %， 其 次 “碳水 化 合 物 转运 和 代谢 ”(carbohydrate transport and 


metabolism)(G) 与 “转录 ”(Transcription)(K) 等 
比 22 %。 这 些 基 


prediction only)(R) 


口 


响应 的 机 制 提供 数据 支持 。 


通过 厚 朴 基 


因 组 GO 注释 (图 3)， 共 有 13 438 个 基因 


数 的 57.37 96. 


而 在 整个 分 类 中 


功能 分 布 在 “ 


D 


朴 的 基 


办 主要 富 集 在 和 9 


通过 KEGG 通路 注释 ( 
的 35.23 %。 其 注释 结果 分 别 为 5.40 PHJ 2 


理 ”(environmental information processing). 29.85 % 的 “遗传 信 


胞 ”(cell)、“ 结 合 ” 
“细胞 过 程 ” (cellular process) 、“ 代 谢 过 程 ” (metabolic process). 等 功能 的 基 
旧 分 占 33 %， 分 子 功能 占 21 %， 生 物 学 过 程 占 45 9. H 
E 物 学 过 程 中 的 代谢 过 程 。 

图 4)， 对 厚 村 的 8 253 个 基因 


功能 ， 各 占 比 $ %。“ 一 般 功 能 预测 (general function 


进行 了 通 ! 
胞 过 程 ”(cellular Proce 


Uf GO 注释 功能 ， 
(binding) 、“ 众 化 活性 ”(catalytic activity) ~ 


TEREFE, 


因 差 异性 表达 可 以 对 今后 深入 探究 厚 朴 在 进化 过 程 中 对 环境 


占 预测 到 的 总 基 


因 


因 占 据 优 势 地 位 ， 
此 可 见 ， 初 探 到 厚 


占 预测 到 的 总 基因 数 
sses), 4.50 % 的 “环境 信息 处 


息 处 理 ”(genetic information 


processing)、55.09 % 的 “代谢 ” (metabolism)、5.16 WHI “WURR” (organismal systems). KEGG 


的 通路 注释 进一步 了 解 厚 朴 基 


因 在 生物 学 过 程 上 的 功能 , 其 


中 参与 代谢 通路 上 的 基因 


占 主 要 地 位 ， 


淀粉 和 蔗糖 代谢 (ko00500)、 氮 基 酸 的 生物 合成 ko01230) 及 碳 代 谢 (ko01200 ) 为 主要 的 代谢 通路 。 
2.5 比较 基因 组 学 分 析 


现在 预测 得 到 的 23 


FIRAR, EÉ 
步 确定 


为 了 进 


线性 图 ( 


因 区 域 。 从 图 


424 个 基 


通过 对 厚 朴 与 葡萄 、 拟 南 芥 、 水 稻 、 杨 树 、 作 
有 20 801 个 基 


[A] 
预测 分 类 结果 见 〈 


图 8) , 比较 
同 源 基因 之 间 的 连 线 ， 没 有 线条 的 空 
中 看 出 两 者 基 


F 


悍 朴 的 种 属 关 系 ， 以 单 拷贝 蛋白 序列 进 
息 的 物种 ， 构 建 出 遗传 进化 树 ( 


图 5， 表 4) 。 


行 比较 分 析 ， 选 择 上 述 8 个 已 知 基 


、 无 油 樟 、 茶 树 及 牛 樟 的 蛋白 序列 比 对 ， 发 
因 可 以 分 类 到 12 129 个 家 族 , 其 中 有 515 个 基因 家 族 是 


因 


图 6)， 结 果 表 明 厚 村 与 牛 述 聚 为 一 文 ， 两 者 间 物 在 
。 根 据 物 种 分 化 时 间 分 析 (图 7， ， 两 者 分 化 时 间 约 在 122.5 百 万 年 前 mya) 。 而 通过 绘 人 


V 


EG ^E 


x 域 代表 没有 比 对 上 的 序列 ， 


亲缘 关系 
Ji 


因 组 的 同 源 性 。 比 对 结果 的 共 线 性 图 中 的 每 一 条 线 代 表 


代表 物种 之 间 存 在 差别 的 基 


办 组 片段 能 比 对 的 上 的 片段 较 少 ， 发 现 两 者 基因 组 存在 较 大 差异 。 
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3 (x10?) 


频率 
Frequency 


| T" 


ÀBCDEFGHIJKLMNOPORSTUVMYZ 
功能 分 类 


N< TCHNDO TN 全 IDOMONODYY 


Function class 


A-Z. 不 同 的 字母 和 颜色 代表 基因 不 同 的 KOG 功能 。 A. RNA 加 工 和 修饰 ; B. 染色 质 结构 和 动力 
学 ; C. 能 量 生 产 和 转换 ; D. 细胞 周期 调控 , 细胞 分 裂 ， 染色 体 分 配 ; E. 氨基 酸 转 运 和 代谢 ; F. E 
苷 酸 转运 和 代谢 ，G. 碳水 化 合 物 转运 和 代谢 ，H. 辅酶 转运 和 代谢 ; 工 脂 质 转运 和 代谢 ; J. 翻译 ， 
核糖 体 结构 和 生物 合成 ;， K. 转录 ; L. 复制 ， 重 组 和 修复 ; M. 细胞 壁 /细胞 膜 / 胞 外 被 膜 生物 合成 ; 
N. 细胞 运动 ，O. 翻译 后 修饰 ， 蛋 白质 转换 ， 伴 侣 ;了 P. 无 机 离子 转运 和 代谢 ，Q. 次 级 代谢 产物 
的 生物 合成 ， 转 运 和 代谢 ; 及. 一 般 功 能 预测 ; S. 功能 未 知 ; T. 信和 号 转 导 机 制 ; U. 胞 内 运输 ， 分 
泌 和 襄 泡 运输 ，V. 防御 机 制 ，W. 胞 外 结构 : Y. 细胞 核 结构 ，Z. 细胞 骨架 。 

A-Z. Different letters and colors represent different KOG functions of genes. A. RNA processing and 


modification; B. Chromatin structure and dynamics; C. Energy production and conversion; D. Cell cycle 
control, cell division, chromosome partitioning; E. Amino acid transport and metabolism; F. Nucleotide 
transport and metabolism; G. Carbohydrate transport and metabolism; H. Coenzyme transport and 
metabolism; I. Lipid transport and metabolism; J. Translation, ribosomal structure and biogenesis; K. 
Transcription; L. Replication. recombination and repair; M. Cell wall/membrane/envelope biogenesis; 
N. Cell motility; O. Posttranslational modification, protein turnover, chaperones; P. Inorganic ion 
transport and metabolism; Q. Secondary metabolites biosynthesis, transport and catabolism; R. General 
function prediction only; S. Function unknown; T. Signal transduction mechanisms; U. Intracellular 
trafficking, secretion, and vesicular transport; V. Defense mechanisms; W. Extracellular structures; Y. 
Nuclear structure; Z. Cytoskeleton. 
图 2 KOG 功能 注释 分 类 统计 图 
Fig.2 KOG function annotation classification chart 


202005.00073v1 


chinaXiv 


ChinaXiv& (EB 


$ 

S S 

Y e 

2 

Y 

2 EA 3 
d as 
EZ d g, 
Ro FI 
由 r3] 
*- o Er 
Hz & à 
Hg H E 
8 2 

o 过 

ù 一 D 

9 

- e 

e 


Ax B1C4 D1 E1 FiG H1 h Ja Ka L4MSN4O: A2B2C2D2E2F2G:H212J2 K2 L2 MHN:O;A:BsCs D;EsF s GsHsI5 Js Ks L:MsN5OsPS Q5R5S5 T2Us 


细胞 组 分 分 子 功能 生物 学 过 程 
Cellular component Molecular function Biological process 


A,íU; GO 功能 分 类 。Ai. 胞 外 区 ; Bi 细胞 ，Ci. SER: D. 细胞 膜 ，E1. 病毒 粒子 ，F1. 细胞 连接 点 ，G1. 膜 封 
BIS Ha. 高 分 子 复 合 物 ; n. 细胞 器 ; Je 胞 外 区 部 位 ，Ki. 细胞 器 部 位 ; La 病毒 粒子 组 成 ， MG. 细胞 膜 部 位 ; 
N, 细胞 部 位 ，O1. 超 分 子 复合 物 ，Az. 转录 因子 活性 ， 和 蛋白 结合 ，B2. 核酸 结合 转录 因子 活性 ;C2. 催化 活性 
D, 信号 转 导 活性 ，E2. 结构 分 子 活动 ; F2. 转运 活性 ， Gy 结合 Ho 电子 载体 活动 ; 了 . 抗 氧化 活性 ;Jo. 金属 伴 
IPEA Ko 蛋白 标志 物 ， Ls. 翻译 调治 活性 ，M2. 营养 库 活动 ，N2. 分 子 传 感 器 活动 ，O2. 分 子 功能 调节 器 ; 
A; 生殖 ; B. 细胞 杀伤 ，C3. 免疫 系统 过 程 ; D3. 代谢 过 程 ; E3. 细胞 过 程 ; Ky 生殖 过 程 ; G3. 生物 附着 ; H, 信 
号 转 导 ; bL. 多 细胞 生物 过 程 ，Js. 发 育 过 程 ，K3. 生长 ，L3. 23); M; 单一 生物 过 程 ，N3. 生物 相 ;O3. 节律 过 
fü P. 胁迫 应 答 ，Q3. 定位 ; Ra. 多 生物 过 程 ，S3. 生物 调控 ; T. 细胞 组 分 或 生物 合成 ，Us. 解毒 。 

Al-U3. GO classify. Al. Extracellular region; B,. Cell; C1. Nucleoid; Dj. Membrane; E4. Virion; F4. Cell junction; G4. 


H 


Membrane-enclosed lumen; H4. Macromolecular complex; I4. Organelle; Jı. Extracellular region part; Kj. Organelle part; 
Lı. Virion part; Mı. Membrane part; N,. Cell part; O1. Supramolecular complex; A». Transcription factor activity, protein 
binding; B Nucleic acid binding transcription factor activity; C5. Catalytic activity; D2. Signal transducer activity; E». 


Structural molecule activity; F2. Transporter activity; G2. Binding; H2. Electron carrier activity; D. Antioxidant activity; J2. 


Metallochaperone activity; K»;. Protein tag; L}. Translation regulator activity; M». Nutrient reservoir activity; N». 
Molecular transducer activity; O2. Molecular function regulator; A3. Reproduction; B5. Cell killing; Cs. Immune system 
process; D3. Metabolic process; E;. Celluar process; F3. Reproductive process; G3. Biological adhesion; H3. Signaling; Iz. 
Multicellular organismal process; J3. Developmental peocess; K3. Growth; L5. Loconotion; M3. Single-organism process; 
Ns. Biological phase; O3. Rhythmic process; P3. Response to stimulus; Q3. Localization; R3. Multi-organism process; S5. 


Biological regulation; T3. Cellular component organization or biogenesis; U3. Detoxification. 


3 GO 二 级 节点 注释 分 类 统计 图 


Fig.3 GO secondary node annotation classification chart 
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MAZ Endocytosis EN 140 细 胸 过程 
过 氧化 物 酶 体 Peroxisome IS 81 Cellular processes. 
和 刚体 Phagosome 65 
磷脂 酰 肌 醇 信 号 系统 Phosphatidylinositol 50 
植物 激素 信号 转 导 Plant hormone signal transduction MN 188 
o 58 


环境 信息 处 理 


Environmental information processing 


101 
半 胱 氨 酸 与 蛋氨酸 代谢 Cysteine and methionine MINE 85 
甘氨酸 、 丝 氨 酸 和 苏 氨 酸 代谢 Glycine, serine and threonine lll 66 
酷 氨 酸 代 谢 Tyrosine metabolism 64 
类 黄酮 生物 合成 Flavonoid biosynthesis 49 
异 唑 啉 生物 碱 的 生物 合成 lsoguinoline alkaloid biosynthesis 47 
氨基 糖 和 核 苷 酸 糖 代谢 Amino sugar and nucleotide sugar metabolism  * 190 
. ” 茶 丙 酸 生物 合成 Phenylpropanoid biosynthesis 121 
果糖 和 甘露 糖 代 谢 Fructose and mannose metabolism lli 58 
半 乳 糖 代谢 Galactose metabolism lll 57 
二 羧 酸 代谢 Glyoxylate and dicarboxylate metabolism 123 
糖 酵 解 糖 异 生 Glycolysis Gluconeogenesis 64 
磷酸 肌 醇 代谢 Inositol phosphate metabolism 58 
戊 糖 、 葡 萄 糖 醛 酸 转换 Pentose and glucuronate interconversions 78 
戊 糖 磷酸 途径 Pentose phosphate lll 53 代谢 
丙酮 酸 代谢 Pyruvate metabolism ig 84 Motibollem 
淀粉 和 芒 糖 代谢 Starch and sucrose metabolism Lo 207 
光合 生物 中 的 碳 固定 Carbon fixation in photosynthetic organisms 
氧化 磷酸 化 Oxidative phosphorylation E "s 
光合 作用 Photosynthesis 
氨基 酸 的 生物 合成 Biosynthesis of amino acids 217 
碳 代谢 Carbon metabolism EMEN 237 
脂肪 酸 代谢 Fatty acid metabolism ll 66 
脂肪 酸 降解 Fatty acid degradation 48 
甘油 酯 代谢 Glycerolipid metabolism Bl 71 
甘油 磷脂 代谢 Glycerophospholipid metabolism 89 
a- 亚 麻 酸 代谢 alpha-linolenic acid metabolism 65 
氨基 氨基 酸 代谢 Cyano amino acid metabolism ll 58 


谷 胱 甘 肘 代谢 Glutathione metabolism 国电 99 
茧 类 骨架 生物 合成 Terpenoid backbone biosynthesis 48 
味 叭 代谢 Purine metabolism 156 


喀 喧 代谢 Pyrimidine metabolism 


植物 病原 相互 作用 Plant-pathogen interaction TA 体系 统 
15 20 25 30 35 40 45 50 
注释 的 基因 
Annotated gene (%) 
Kl4 KEGG 功 能 注释 图 
Fig.4 KEGG function annotation diagram 
X4 基因 家 族 分 类 统计 
Table 4 Gene family classification statistics 
总 基因 数目 基因 家 族 数 目 。 特有 基因 家 族 数 
物种 名 的 基因 数目 
Total gene Total family Unique gene 
Species Name Cluster gene 
Number Number family number 
Number 
无 油 樟 
16 986 15 343 11 651 290 
Amborella trichopoda 

dd 

35 905 23 405 10 153 1870 

Ginkgo biloba 

茶树 

36 951 23 049 12 661 1 091 

Camellia sinensis 

杨 树 

41 335 33 324 14 530 1 400 

Populus trichocarpa 

^F gi 

26 531 22242 12 284 636 

Cinnamomum kanehirae 

水 稻 

38 852 25 545 12 766 2172 


Oryza sativa 
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E 
23 424 20 801 12 129 515 
Magnolia officinalis 
TU FS TT 
27 369 23 127 12 804 997 
Arabidopsis thaliana 
LES] 
26 346 19271 12 726 760 
Vitis vinifera 
T 
[e] 
% i^ 
E HN? 
E e 
_ 
E 
= 


基因 个 数 
Number of gene 
20 


10 


物种 


Species 


a-i 为 不 同 物种 。a. 无 油 樟 ; b. RE; c. 茶树 ; d. 杨 树 ; e. 牛 樟 ; f. 水 稻 ; g. 厚 朴 ，h. 拟 南 芥 ; b 葡萄 。A-E. 


为 不 同 基因 分 类 。A. 未 被 聚 类 的 基 
E. 单 拷贝 同 源 基因 。 


a-i. Different species. a. Amborella 


因 ; B. 其 它 所 有 的 基因 ; C. 特异 基因 家 族 中 的 基因 ; D. 多 拷贝 同 源 基 因 ， 


trichopoda; b. Ginkgo biloba; ¢. Camellia sinensis; d. Populus trichocarpa; e. 


Cinnamomum kanehirae; f. Oryza sativa; g. Magnolia officinalis; h. Arabidopsis thaliana; i. Vitis vinifera. A-E. Different 


gene classification. A. Unclusternum; B. Other gene; C. Special gene; D. Multcopy; E. Onecopy. 


Fig 


图 5 ”家族 聚 类 统计 直方 图 


.5 Family clustering statistical histogram 
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6 物种 间 进 化 关系 


Fig.6 Evolution relationship among Species 


厚 朴 

Magnolia officinalis 

牛 樟 
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Kf 


Oryza sativa 
174.6(143.5-223.0) 拟 南 芥 


z Arabidopsis thaliana 
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葡萄 
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7 物种 间 分 化 时 间 


Fig.7 Time of species differentiation 
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LG0-11 分 别 代表 Lachesis Group 0-11( 只 显示 了 12 条 染色 体 共 线 性 ) 。 
LGO0-11 stands for Lachesis Group 0-11 (only 12 chromosomes are shown). 
8 共 线 性 图 
Fig.8 Collinear diagram 


3 讨论 


基因 组 测序 技术 和 生物 信息 学 技术 的 进一步 发 展 ， 并 且 测 序 成 本 的 降低 和 分 析 方 法 的 完善 极 
大 的 推动 了 对 厚 朴 这 种 非 模式 药 用 植物 的 基因 组 测序 研究 。 目 前 常用 的 测定 基因 组 大 小 的 方法 有 
流 式 细胞 术 《〈 林 瀚 等 ，2019) 、 第 二 代 高 通 量 测序 技术 〈 李 西 文 等 ，2012) 及 已 发 展 至 第 三 代 的 
单 分 子 测序 技术 《〈 柳 延 虎 等 ，2015) ， 本 研究 通过 第 三 代 测 序 技术 测 得 的 厚 朴 (Masgmrolia officinalis) 
的 全 基因 组 大 小 约 为 1.68 Gb， 与 前 人 〔 叶 林 江 等 ，2015) 通过 流 式 细胞 术 检 测 的 木兰 属 物种 四 叶 
厚 机 (M. officinalis subsp.biloba) (2n=2x=38) 的 基因 组 大 小 为 1.59 Gb 相符 合 。 物 种 的 基因 组 大 
小 与 其 倍 性 水 平和 染色 体 数 目 存在 一 定 的 正 相 关 性 〈 叶 林 江 等 ，2015) ， 有 研究 者 〈 王 跃 华 等 ， 
2005) 利用 厚 村 新 生 的 愈 伤 组 织 制作 染色 体 切片 ， 显 微观 察 结果 显示 其 染色 体 数 为 2n=38， 上 述 
提 到 的 止 叶 厚 朴 也 属于 2 倍 体 ， 染 色 体 数 为 38 条 ， 表 明 本 次 测 得 的 厚 朴 基因 组 大 小 符合 其 倍 性 水 
平和 染色 体 数 目 。 


IH TI 
iH L] 


基因 组 功能 注释 是 对 物种 功能 基因 解析 的 一 重要 方面 。 本 研究 通 对 厚 朴 的 基因 组 功能 注释 分 
析 发 现 ， 在 GO 功能 注释 中 厚 朴 的 基因 集中 在 生物 学 过 程 中 “代谢 过 程 ”， 这 与 KEGG 通路 注释 
的 结果 显示 在 “代谢 通路 ”上 的 基因 占 主 要 地 位 相符 ， 其 中 尝 粉 和 蔗糖 代谢 、 氢 基 酸 的 生物 合成 
及 碳 代 谢 为 主要 的 代谢 通路 。 有 研究 者 〈 杨 旭 等 ，2019) 利用 Humina 高 通 量 测序 技术 对 厚 朴 根 、 
茎 、 叶 不 同 组 织 进行 转录 组 分 析 ， 功 能 注释 的 结果 显示 厚 朴 的 主要 生物 代谢 途径 为 碳水 化 合 物 代 
谢 、 氨 基 酸 代谢 和 能 量 代谢 ， 与 本 研究 得 到 的 厚 村 代谢 通路 注释 结果 相对 应 。 通 过 把 厚 村 基因 组 
和 转录 组 分 析 相 结合 ， 有 利于 下 一 步 针 对 厚 朴 的 功能 基因 发 掘 和 分 析 。 

目前 关于 厚 朴 等 药 用 植物 研究 较 多 还 是 其 叶绿体 基因 组 ， 是 由 于 核 基 因 组 包含 丰富 的 遗传 信 
恩 ， 所 以 基因 组 很 大 ， 同 时 组 成 结构 复杂 ， 多 倍 性 与 高 度 的 重复 序列 片段 也 给 测序 带 来 很 大 的 困 
XE EBE, 2014) 。 但 通过 上 述 与 前 人 研究 验证 ， 表 明 本 研究 获得 的 厚 朴 全 基因 组 序列 是 较 高 
质量 的 序列 , 这 也 是 木兰 属 物种 中 首 个 核 DNA 全 基因 组 序列 ,对 后 续 分 析 研 究 木 兰 属 甚 至 木兰 科 
物种 起 源 和 进化 关系 提供 了 参考 基因 组 序列 。 厚 朴 全 基因 组 测序 的 完成 ， 是 进行 药物 植物 的 分 子 
青 助 育种 的 重要 一 步 ， 基 于 基因 组 学 、 和 蛋白 组 学 和 种 质 信息 等 相关 数据 ， 利 用 生物 信息 学 方法 分 
厅 ， 最 终 筛 选 出 最 佳 基因 型 和 育种 方案 〈 马 小 军 和 呐 长 明 ，2017) ， 这 对 在 临床 上 需求 较 大 的 药 
植物 是 一 个 新 颖 的 培育 方法 。 全 基因 组 序列 也 是 对 后 续 研究 厚 朴 的 功能 基因 组 学 〈 王 勇 波 等 ， 
2009) 提供 了 数据 支撑 ， 通 过 转录 组 学 和 代谢 组 学 对 药 用 植物 的 次 生 代 谢 产 物 合成 的 关键 酶 鉴定 
和 代谢 途径 解析 ， 并 筛选 出 关于 生长 发 育 、 抗 病 抗 逆 等 优良 性 状 基 因 位 点 ， 是 解决 对 厚 村 资源 开 
发 利用 不 够 深入 一 个 有 效 策略 。 本 研究 通过 对 厚 村 的 全 基因 组 测序 可 以 从 分 子 层面 加 深 对 物种 的 
认识 ， 对 其 它 药 用 植物 的 全 基因 组 测序 提供 参考 ， 也 为 今后 进一步 开发 利用 中 药 资源 提供 相关 分 
子 生物 学 基础 ， 促 进 中 药材 的 现代 化 。 
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